자연어학처리3-형태소 분석방법 | ◈자연어학◈ :: 개발참고자료[SSISO Community]
 
SSISO 카페 SSISO Source SSISO 구직 SSISO 쇼핑몰 SSISO 맛집
추천검색어 : JUnit   Log4j   ajax   spring   struts   struts-config.xml   Synchronized   책정보   Ajax 마스터하기   우측부분

개발참고자료
[1]
등록일:2008-04-07 12:33:01 (0%)
작성자:
제목: 자연어학처리3-형태소 분석방법 | ◈자연어학◈

언어독립적인 방법론

(1)Two-level형태론:two -level형태론은 변형생성이론에서 발생하는 변형규칙의 적용순서를 결정하는 문제를 해결하기 위하여 중간단계의 변형과정을 없애고 변형규칙 대신에 변형규칙들의 합성규칙인 two-level규 칙을 사용하는 형태론이다. 이런한 two-level형태론을 바탕으로 형태소를 분석하거나 생성하기 위해 실제로 형태소분석 시스템을 구현하는 방법론이 two-level모델이다.two-level모델에서 사용되는 two-level규칙은 단위규칙인 여러개의 변형규칙이 일정한 순서에 따라 적용되는것을 하나의 규칙으로 통합한것이다.two-level규칙은 단어의 어휘형과 표층형을 직접 일치시켜주는 문자열 변환규칙으로 기술되는데 형태소분석과 생성에 양방향으로 사용될수 있어서분석규칙과 생성규칙이 동일하게 기술된다.

(2)음절기반 형태론:영 어명사의 복수형 문제뿐만 아니라 two-level규칙은 제약조건을 문자열 일치에 의해 기술하는 제약으로 인하여 독일어의 움라우트와 같이 문자열의 일치만으로 기술하기 어려운 현상을 처리하지 못하는 문제가 있다. 이러한 현상을 처리하기 위해 cahill은two-level규칙을 기술할때 음절을 기반으로 기술하는 방법을 제시하였다. 이 모델은 two-level모델과 마친가지로 two-level형태론을 따르고 있으나 단지 two-level규칙을 기술할 때 문자열 문맥이 아니라 음절의 특성집합(feature set)을 단위로 하여 기술하는 점이 다르다. 이렇게 함으로써 문자열 문맥으로 기술하기 어려운 비선형적(non-linear)인 음운 현상을 처리하기가 용이하다.

한국어 형대소 방법론

(1)Head-tail구분법:단어로부터 형태소를 분리하는 방법으로 단어를 변형되지 않는 부분(head)과 변형되는 부분(tail)으로 분리하고 head와 tail간의 결합관계를 접속 정보표에 의해 검사함으로써 분석을 수행하는 top-down방식이다.

(2)Tabular파싱법:bottom -up방식에 의한 형태소 분석으로 먼저 단어를 이루고 있는 모든 자모단위의 부분 문자열(substring)에 대해 사전을 검색하여 모든 가능한 어휘 형태소와 문법 형태소를 추출한다.이렇게 추출된 형태소들은 삼각 테이블에 저장하고 여기에 변형된 CYK알고리즘을 적용하여 단어를 이루는 형태소들을 찾는 방법이다.

(3)최장일치법과 최단일치법:최 장일치법은 단어를 이루는 부붐 문자열 집합을 구할때 그 단어를 이루고 있는 형태소들의 집합중에서 가장 긴 형태소를 우선적으로 선태갛여 검사하는것이고, 최단일치법은 가장 짧은 형태소를 우선적으로 검사하는 방법이다.이러한 방법은 tabular파싱법이 동적 프로그래밍을 이용할때 발생하는 비효율성을 제거하고 알고리즙의 효율을 높이기 위해서 우선 순위가 높은 형태소 먼저 검사하는 선택의 선호도(prefernce)를 반영한것이라고 할수 있다.

(4)음절단위 분석법:시스템의 효율을 좌우하는 사전 검색의 비효율성을 개서낳고 형태소의 범주를 세분화 함으로써 발생하는 유지 보수의 편리성 문제를 해결하기 위한 방법으로 제안되있다.



출처 : http://blog.daum.net/autumn78/8068135

[본문링크] 자연어학처리3-형태소 분석방법 | ◈자연어학◈
[1]
코멘트(이글의 트랙백 주소:/cafe/tb_receive.php?no=7316
작성자
비밀번호

 

SSISOCommunity

[이전]

Copyright byCopyright ⓒ2005, SSISO Community All Rights Reserved.